global avx2_add
section .text

; 函数定义
avx2_add:
    vmovaps ymm0, [rcx]  ; 将第一个数组加载到YMM0寄存器
    vmovaps ymm1, [rdx]  ; 将第二个数组加载到YMM1寄存器
    vaddps ymm0, ymm0, ymm1 ; 执行逐元素相加操作
    vmovaps [r8], ymm0  ; 将结果存储到目标数组
    ret